Компания AudioCodes, приложившая в своё время немало усилий по созданию кодека G.723.1 специально для использования в сетях IP-телефонии, предлагает свою новую разработку - кодек NetCoder. По словам AudioCodes, кодек обладает качеством превосходящим популярные кодеки G.723.1 и G.729 и не требует значительных вычислительных ресурсов. Однако, производители голосовых шлюзов пока не торопятся поддерживать данное творение в своих продуктах. Не включен этот кодек также и в семейство кодеков стандарта Н.323. Использовать сегодня NetCoder в голосовых шлюзах можно не без риска потери совместимости с шлюзами других производителей, установленных в сети. Кодек NetCoder работает в диапазоне скоростей 4,8 – 9,6 Кбит/с, при формировании кадра вносит задержку 20 мс и имеет встроенный механизм оптимальной трансляции речевых пауз, основанный на технологии порогового детектирования голосовой активности VAD и автоматическую регулировку скорости передачи.
Технология VAD
используется совместно с большим числом речевых кодеков. Попытаюсь кратко
проиллюстрировать механизм VAD на простейшем примере (см. рис. 10). Входной
аналоговый сигнал поступает на вход устройства сравнения, в котором
измеряется его амплитуда и сравнивается с заданным пороговым значением.
При превышении амплитудой входного сигнала заданного порога (красная линия
на рис. 10), сигнал поступает на вход кодека и кодируется по определённому
алгоритму (интервал Т2 – Т3). Если амплитуда
входного сигнала ниже порогового значения (например в интервал Т1
– Т2), то в момент времени Т1 передаётся
только служебная информация (длиной в несколько бит) о начале паузы, а в
момент Т2 о её окончании. На приёмной стороне, во время паузы,
для улучшения субъективного восприятия кодированной речи может
передаваться комфортный шум. Ниже я ещё дополнительно рассмотрю
особенности применения технологии VAD.